Your browser doesn't support javascript.
Show: 20 | 50 | 100
Results 1 - 6 de 6
Add filters

Year range
rev. udca actual. divulg. cient ; 25(1): e1947, ene.-jun. 2022. graf
Article in Spanish | LILACS-Express | LILACS | ID: biblio-1395198


RESUMEN Las herramientas automatizadas de análisis de texto resumen grandes volúmenes de información y permiten generar, de forma eficiente, conocimiento a partir de datos desestructurados, como las opiniones. El objetivo de este trabajo fue identificar prioridades en comunidades afectadas por el conflicto armado, utilizando ejercicios participativos de 13 municipios de Antioquia, Colombia. Se analizaron 15.534 opiniones, de 9.765 personas; tras una limpieza de texto, se describió el uso, la asociación, la diferenciación y la importancia de los términos, según los enfoques temáticos y tipos de opinión expresados, utilizando minería de texto en R. Se encontró que las prioridades giraban en torno a la disponibilidad de infraestructuras, dotación e insumos, ya que eran las problemáticas más mencionadas por las comunidades y correspondía con la realidad territorial; por otra parte, las oportunidades estaban representadas, principalmente, por los recursos naturales y humanos. El análisis de minería de texto del ejercicio participativo permitió identificar las prioridades de las comunidades, a nivel socioeconómico, de forma satisfactoria; sin embargo, la preparación de la información requiere mucho trabajo y los resultados se deben revisar cuidadosamente, para asegurar su coherencia. Que la información pueda ser analizada por agentes externos a la colección de datos, representa otra ventaja de esta herramienta.

ABSTRACT Automated text analysis tools summarize large volumes of information and allow efficient generation of insights from unstructured data such as opinions. The objective of this work was to identify priorities in communities affected by the armed conflict using participatory exercises in 13 municipalities of Antioquia, Colombia. 15,534 opinions from 9,765 people were analyzed. After a text cleaning, the use, association, differentiation and importance of the terms were described according to the thematic approaches and types of opinion expressed using text mining in R. It was found that the priorities revolved around the availability of infrastructures, endowment and inputs, since they were the most mentioned problems by the communities, and that this corresponded to the territorial reality. On the other hand, the opportunities were mainly represented by natural and human resources. The text mining analysis of the participatory exercise allowed to identify the priorities of the communities at the socio-economic level in a satisfactory way. However, the preparation of the information is labor intensive and the results must be carefully reviewed to ensure consistency. Another advantage of this tool is that the information can be analyzed by external agents to the data collection.

Medicina (B.Aires) ; 82(4): 513-524, 20220509. graf
Article in Spanish | LILACS-Express | LILACS | ID: biblio-1405696


Resumen El síndrome urémico hemolítico (SUH) está caracterizado por microangiopatía trombótica, anemia hemolítica, trombocitopenia e insuficiencia renal aguda. Puede causar desde secuelas permanentes hasta muerte, principalmente en niños. En este trabajo, utilizando minería de textos (MT), se analizó el texto explícito e implícito de 16 192 artículos científicos originales sobre SUH indexados en la base de datos de Europe PMC. Los objetivos fueron examinar comportamientos, realizar seguimiento de tendencias, hacer predicciones y cruzar datos con otras fuentes de información. Para el análisis se utilizaron -entre otras herramientas infor máticas- flujos de trabajo (FT) especialmente desarrollados en la plataforma KNIME. La MT sobre las palabras de los resúmenes de las publicaciones permitió: detectar asociaciones no descritas entre eventos relacionados con SUH; extraer información subyacente; hacer agrupamientos temáticos mediante algoritmos no supervisados; realizar predicciones sobre el curso de las investigaciones asociadas al tema. Tanto el abordaje como los FT desarrollados para realizar Ciencia de Datos sobre SUH pueden aplicarse a otros temas biomédicos y a otras bases de datos científicos, permitiendo analizar aspectos relevantes en el campo de la salud humana para me jorar la investigación, la prevención y el tratamiento de múltiples enfermedades.

Abstract Hemolytic uremic syndrome (HUS) is characterized by thrombotic microangiopathy, hemolytic anemia, thrombocytopenia and acute renal failure. It can cause from permanent sequelae to death, mainly in children. In this work, using text mining (TM), we analyzed the explicit and implicit text of 16 192 original scientific articles on HUS indexed in the Europe PMC database. The objectives were to examine behaviors, track trends, and make predictions and cross-check data with other sources of information. For the analysis we used -among other computational tools- specially developed workflows (WF) in the KNIME platform. The TM on the words of the abstracts of the publications made it possible to: detect undescribed associations between events related to HUS; extract underly ing information; make thematic clustering using unsupervised algorithms; make forecasting about the course of research associated with the topic. Both the approach and the WFs developed to perform Data Science on HUS can be applied to other biomedical topics and other scientific databases, making it possible to analyze relevant aspects in the field of human health to improve research, prevention and treatment of multiples diseases.

Medicina (B.Aires) ; 81(2): 214-223, June 2021. graf
Article in Spanish | LILACS | ID: biblio-1287273


Resumen En el presente trabajo utilizamos la minería de texto como herramienta de tratamiento de una gran base de datos científica, con el objetivo de obtener nueva información de todas las publicaciones firmadas por autores argentinos e indexadas hasta 2019 en el área de las ciencias de la vida. Se analizaron más de 75 000 artículos, publicados en alrededor de 5000 medios, firmados por cerca de 186 000 autores con lugar de trabajo en la Argentina o en colaboraciones con laboratorios argentinos. Mediante herramientas automatizadas, que fueron desarrolladas ad hoc, se analizó el texto de alrededor de 70 800 resúmenes y se buscaron, mediante detección digital no supervisada, los principales temas abordados, su relación con problemáticas de salud en la Argentina y su tratamiento. Se presentan, además, resultados del número de publicaciones por año, las revistas que las publicaron, y sobre sus autores y colaboraciones. Estos resultados, junto con las predicciones que se obtuvieron, podrían constituirse en una herramienta útil para optimizar el manejo de recursos dedicados a la investigación básica y clínica.

Abstract In the present work we use text mining as a treatment tool for a large scientific database, with the aim of obtaining new information about all the publications signed by Argentine authors and indexed until 2019, in the area of life sciences. More than 75 000 articles were analysed, published in around 5000 media, signed by about 186 000 authors with a workplace in Argentina or in collaborations with Argentine laboratories. Using automated tools that were developed ad hoc, the text of around 70 800 abstracts was analysed, seeking, through non-supervised digital detection, the main topics addressed by the authors, and the relationship with health problems in Argentina and their treat ment. Results are also presented regarding the number of publications per year, the journals that have published them, and their authors and collaborations. These results, together with the predictions that were obtained, could become a useful tool to optimize the management of resources dedicated to basic and clinical research.

Humans , Data Mining , Argentina
Rev. habanera cienc. méd ; 18(4): 678-692, jul.-ago. 2019. tab, graf
Article in Spanish | LILACS-Express | LILACS | ID: biblio-1093895


RESUMEN Introducción: Especialistas de la Facultad de Psicología de la Universidad de La Habana propusieron el cuestionario sobre Bienestar Humano Personal, Laboral y Social (BHPLS), que se aplicó a 135 trabajadores cubanos de tres grupos sociolaborales. Dada la variedad de respuestas, se impuso un análisis de contenido (AC) para la Pregunta 1 del cuestionario. Objetivo: Proponer e implementar un software que permita la categorización semiautomática en un AC para dicha pregunta. Material y Métodos: Se utilizó el índice de concordancia Kappa para evaluar el acuerdo entre expertos respecto al esquema de categorías. Se implementó un software en el lenguaje de programación Python para cumplir el objetivo, considerando las funcionalidades de softwares similares. Resultados: Se implementó, validó y registró un software "BHPLS data processing-UH®" que permite establecer las categorías, cargar los datos, categorizarlos semiautomáticamente y guardar el resultado, entre otras funcionalidades. La categorización manual con estudiantes de Psicología obtuvo un índice de concordancia Kappa negativo (bajo acuerdo entre expertos), mientras que usando el software propuesto, se alcanzó un Kappa global 0.7871 con p=0.00 (alta concordancia y alta significación estadística). Además, se propuso un algoritmo para la unificación de las categorizaciones de expertos y se ejecutó un Análisis de Correspondencias (ANACOR) sobre la combinación de categorizaciones obtenidas. Conclusiones: Dada la alta concordancia alcanzada, se recomienda el uso del software por su adaptabilidad, facilidad de uso y la "humanización" del AC. El ANACOR permitió observar similitudes entre los grupos sociolaborales. Las funcionalidades del software pueden aplicarse para el procesamiento de asociaciones libres en otros escenarios.

ABSTRACT Introduction: Experts of the Faculty of Psychology of the University of Havana proposed the Personal, Labor and Social Human Well-being questionnaire (BHPLS, in Spanish), that was applied to 135 Cuban workers of three social and occupational groups. Given the variety of responses, a content analysis (CA) was used for Question 1 of the mentioned questionnaire. Objective: To present and implement a software that allows a semi-automatic categorization in a CA used for this question. Material and Methods: The Kappa index test was used to evaluate experts´ agreement with respect to category schemes. We implemented a software with the Python programming language to achieve our objective, considering other similar software functionalities. Results: We implemented, validated and registered the software BHPLS data processing-UH® that allows to set up a categories system, load the collected data, categorize associations in a semi-automatic way, and save the results, among other functionalities. This software was validated by Psychology students and, when they performed the manual categorization, a negative Kappa agreement index (low categorization agreement between experts) was obtained whereas using the proposed software, a global Kappa index of 0.7871 with p=0.00 (high and statistically significant categorization agreement between experts) was obtained. Besides, we proposed a unified algorithm for expert's categorizations, and carried out a Correspondence Analysis (ANACOR) on the basis of the categorizations achieved. Conclusions: According to the high concordance attained, we recommend the software due to its adaptability, ease of use, and "humanization'' of the process. The CA allowed us to observe similarities in social and occupational groups. The software functionalities can be applied for processing free associations in other scenarios.

Rev. latinoam. psicol ; 50(1): 61-70, jan.-abr. 2018. tab, graf
Article in English | LILACS, COLNAL | ID: biblio-978645


Abstract A peace agreement was recently subjected to a plebiscite as a solution to finish the Colombian armed conflict. With 62.57% of abstention, 18.44% of the Colombian electorate rejected this agreement. This paper aims to propose a methodological approach that shows how to linguistically analyze peace agreements as political products that are acceptable or not according to their text difficulty. Given the socio-political similarities of the armed conflicts of Colombia, Guatemala, and El Salvador, we scrutinized with sufficient computational detail these peace agreements. The results revealed that the text difficulty of these accords was more appropriate for a person with at least 19 years of education, suggesting that these sort of texts are not written for broader and less-educated audiences.

Resumen El gobierno de Colombia sometió recientemente a plebiscito un acuerdo de paz para dar por finalizado su conflicto armado. Para este plebiscito la abstención electoral fue del 62.57% y solo el 18.44% de los votantes rechazó la implementación del acuerdo. El objetivo de este trabajo es proponer una aproximación metodológica que muestre cómo analizar los acuerdos de paz como productos políticos que pueden ser aceptables o no según su dificultad textual. Dadas las semejanzas socio-políticas de los conflictos armados en Colombia, Guatemala y El Salvador, en este trabajo se muestra con suficiente detalle computacional el análisis por minería de texto de los acuerdos de paz celebrados en estos países. Los resultados revelaron que la dificultad textual de estos acuerdos exige un nivel educativo de al menos 19 años de educación formal, lo que sugiere que ese tipo de documentos no suelen redactarse para audiencias más numerosas con menores niveles de educación formal.

Human Rights , Smog , Communication Barriers , Armed Conflicts , Data Mining
Educ. med. super ; 30(3): 669-677, jul.-set. 2016. graf
Article in Spanish | LILACS | ID: biblio-828685


Introducción: los estudiantes manifiestan pobres habilidades investigativas y el entrenamiento que reciben no satisface estas necesidades. Objetivo: entrenar estudiantes de quinto año de Medicina en realizar investigaciones cualitativas durante la educación en el trabajo para caracterizar, en este caso, elementos de sexualidad en adolescentes y analizarlas con técnicas de minería de textos. Métodos: durante abril de 2015, un grupo de estudiantes de Medicina de la Universidad de Ciencias Médicas de Camagüey, realizó una exploración de tipo cualitativa en una secundaria y un preuniversitario sobre sus primeras relaciones sexuales y como le hubiera gustado que hubiese sido. Cada estudiante escribió de manera anónima la respuesta a esta pregunta en un papel, el cual se transfirió en un documento texto por cada persona, estos se reunieron por grupos en un folder común que agrupaba a los tres grupos. Se evaluaron los textos en su conjunto, se procedió a transformar las palabras pertenecientes a una familia de palabras (lematización) y se determinaron de manera descendente las palabras más frecuentes encontradas, se procedió a realizar un gráfico para explicar el impacto de las respuestas más importantes. Resultados: la técnica de minería de textos permitió identificar las palabras de más frecuencia y reflejarlas en un gráfico en el que se facilita la interpretación, los alumnos entrenaron las diferentes etapas de la investigación cualitativa. Conclusiones: con el presente trabajo fue posible entrenar a estudiantes de Medicina en realizar investigaciones cualitativas en sus actividades de educación en el trabajo para caracterizar elementos de sexualidad en adolescentes y analizarlas con técnicas de minería de textos(AU)

Introduction: Students manifest poor research skills and the training they receive does not meet these needs. Objective: to train fifth-years medical students in conducting qualitative research in education at work to characterize, in this case, elements of sexuality in adolescents and discuss them with text mining techniques. Methods: During April 2015, a group of medical students from the University of Medical Sciences of Camagüey conducted a qualitative exploration in a junior high school and a senior high school about their first sexual relations and how they would have preferred as it would have been. Each student wrote on a paper and anonymously his/her answer to this question, which was transferred into a text document for each person, later gathered in groups in a common folder which brought the three groups together. The texts as a whole were evaluated, later on the words were transformed as to a word family (lemmatization) and the most frequent words were determined in descending order, we then made a chart to explain the impact of the most important answers. Results: the text mining technique permitted the identification of the most frequent words and to empty them into a graph that made their interpretation easier; the students were trained in the different stages of qualitative research. Conclusions: The present work made possible to train medical students to conduct qualitative research in their education at work activities, in order to characterize elements of sexuality in adolescents and discuss them with text mining techniques(AU)

Students, Medical , Professional Training